개요
양측 검정(two-tailed test)은 통계학에서 가설 검정의 한 형태로, 모수(parameter)가 특정 값과 다르다(≠)는 것을 검정하고자 할 때 사용된다. 즉, 관심 있는 모수(예: 모평균, 모비율 등)가 기준값보다 크거나 작을 가능성 모두를 고려하여 귀무가설을 기각할지를 판단하는 방법이다. 이는 한쪽 방향에만 관심을 두는 단측 검정(one-tailed test)과 대비되는 개념이다.
양측 검정은 일반적으로 연구자가 효과의 방향성에 대해 사전 가정을 하지 않을 때, 또는 두 집단 간 차이가 어느 방향이든 의미 있다고 판단될 때 사용된다. 예를 들어, 새로운 약물이 기존 약물과 효과가 "다르다"는 가설을 검정할 때, 그 효과가 더 강할 수도 있고 약할 수도 있기 때문에 양측 검정이 적절하다.
양측 검정에서 귀무가설($H_0$)과 대립가설($H_1$ 또는 $H_a$)은 다음과 같은 형태를 가진다:
- $H_0: \theta = \theta_0$
- $H_1: \theta \neq \theta_0$
여기서:
- $\theta$: 관심 있는 모수 (예: 모평균 $\mu$, 모비율 $p$ 등)
- $\theta_0$: 특정한 비교값 (예: 기준 평균, 이론값 등)
예를 들어, 어떤 학교 학생들의 평균 IQ가 전국 평균인 100과 같은지 검정하고자 할 때:
- $H_0: \mu = 100$
- $H_1: \mu \neq 100$
이 경우, 학생들의 평균 IQ가 100보다 크거나 작을 가능성 모두를 고려하므로 양측 검정이 필요하다.
검정 통계량과 기각역
양측 검정에서는 양쪽 꼬리(both tails)에 기각역(rejection region)을 설정한다. 유의수준($\alpha$)이 0.05인 경우, 각 꼬리에 0.025씩의 확률을 할당하여 기각역을 구성한다.
예시: 정규분포 기반 Z-검정
표본이 정규분포를 따르고 모표준편차를 알고 있을 경우, Z-검정을 사용할 수 있다. 검정 통계량은 다음과 같이 계산된다:
$$
Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}
$$
이때, 유의수준 $\alpha = 0.05$ 기준으로 양측 검정의 기각역은:
- $Z < -1.96$ 또는 $Z > 1.96$
이 범위에 검정 통계량이 속하면 귀무가설을 기각한다.
양측 검정 vs 단측 검정
| 구분 |
양측 검정 |
단측 검정 |
| 대립가설 형태 |
$\theta \neq \theta_0$ |
$\theta > \theta_0$ 또는 $\theta < \theta_0$ |
| 기각역 위치 |
양쪽 꼬리 |
한쪽 꼬리 |
| 검정력 |
상대적으로 낮음 |
특정 방향에 대해 높음 |
| 사용 상황 |
방향성 없는 차이 검정 |
특정 방향의 효과 기대 시 |
예를 들어, "새로운 비료가 작물 수확량을 증가시킨다"는 가설은 단측 검정이 적절하나, "새로운 비료가 수확량에 영향을 미친다"는 가설은 양측 검정이 적절하다.
p-값 해석
양측 검정에서의 p-값은 귀무가설이 참일 때, 관측된 검정 통계량보다 더 극단적인 값이 양쪽 꼬리에서 나올 확률을 의미한다.
- p-값 < $\alpha$: 귀무가설 기각
- p-값 ≥ $\alpha$: 귀무가설 채택
예를 들어, Z = 2.10이 관측되었을 때, 양측 p-값은 $2 \times P(Z > 2.10) = 2 \times 0.0179 = 0.0358$이다. $\alpha = 0.05$라면 이 값은 유의수준을 하회하므로 귀무가설을 기각한다.
활용 예시
사례: 품질 관리 검사
어떤 공장에서 생산하는 전구의 평균 수명이 1000시간인지 검정하고자 한다.
표본 조사 결과, 평균 980시간, 표준편차 50시간, 표본 크기 100.
- $H_0: \mu = 1000$
- $H_1: \mu \neq 1000$
- 검정 통계량: $Z = \frac{980 - 1000}{50 / \sqrt{100}} = -4.0$
- 기각역: $|Z| > 1.96$ → 기각
결론: 전구의 평균 수명은 1000시간과 유의미하게 다르다.
참고 자료 및 관련 문서
참고 문헌
- Moore, D. S., Notz, W., & Fligner, M. (2021). The Basic Practice of Statistics (9th ed.). W.H. Freeman.
- Montgomery, D. C. (2017). Introduction to Statistical Quality Control (8th ed.). Wiley.
# 양측 검정
## 개요
**양측 검정**(two-tailed test)은 통계학에서 가설 검정의 한 형태로, 모수(parameter)가 특정 값과 **다르다**(≠)는 것을 검정하고자 할 때 사용된다. 즉, 관심 있는 모수(예: 모평균, 모비율 등)가 기준값보다 **크거나 작을 가능성 모두**를 고려하여 귀무가설을 기각할지를 판단하는 방법이다. 이는 한쪽 방향에만 관심을 두는 **단측 검정**(one-tailed test)과 대비되는 개념이다.
양측 검정은 일반적으로 연구자가 효과의 방향성에 대해 사전 가정을 하지 않을 때, 또는 두 집단 간 차이가 어느 방향이든 의미 있다고 판단될 때 사용된다. 예를 들어, 새로운 약물이 기존 약물과 효과가 "다르다"는 가설을 검정할 때, 그 효과가 더 강할 수도 있고 약할 수도 있기 때문에 양측 검정이 적절하다.
---
## 귀무가설과 대립가설
양측 검정에서 귀무가설($H_0$)과 대립가설($H_1$ 또는 $H_a$)은 다음과 같은 형태를 가진다:
- $H_0: \theta = \theta_0$
- $H_1: \theta \neq \theta_0$
여기서:
- $\theta$: 관심 있는 모수 (예: 모평균 $\mu$, 모비율 $p$ 등)
- $\theta_0$: 특정한 비교값 (예: 기준 평균, 이론값 등)
예를 들어, 어떤 학교 학생들의 평균 IQ가 전국 평균인 100과 같은지 검정하고자 할 때:
- $H_0: \mu = 100$
- $H_1: \mu \neq 100$
이 경우, 학생들의 평균 IQ가 100보다 **크거나 작을 가능성 모두**를 고려하므로 양측 검정이 필요하다.
---
## 검정 통계량과 기각역
양측 검정에서는 **양쪽 꼬리**(both tails)에 기각역(rejection region)을 설정한다. 유의수준($\alpha$)이 0.05인 경우, 각 꼬리에 0.025씩의 확률을 할당하여 기각역을 구성한다.
### 예시: 정규분포 기반 Z-검정
표본이 정규분포를 따르고 모표준편차를 알고 있을 경우, Z-검정을 사용할 수 있다. 검정 통계량은 다음과 같이 계산된다:
$$
Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}
$$
- $\bar{X}$: 표본 평균
- $\mu_0$: 귀무가설 하의 모평균
- $\sigma$: 모표준편차
- $n$: 표본 크기
이때, 유의수준 $\alpha = 0.05$ 기준으로 양측 검정의 기각역은:
- $Z < -1.96$ 또는 $Z > 1.96$
이 범위에 검정 통계량이 속하면 귀무가설을 기각한다.
---
## 양측 검정 vs 단측 검정
| 구분 | 양측 검정 | 단측 검정 |
|------|-----------|-----------|
| 대립가설 형태 | $\theta \neq \theta_0$ | $\theta > \theta_0$ 또는 $\theta < \theta_0$ |
| 기각역 위치 | 양쪽 꼬리 | 한쪽 꼬리 |
| 검정력 | 상대적으로 낮음 | 특정 방향에 대해 높음 |
| 사용 상황 | 방향성 없는 차이 검정 | 특정 방향의 효과 기대 시 |
예를 들어, "새로운 비료가 작물 수확량을 증가시킨다"는 가설은 단측 검정이 적절하나, "새로운 비료가 수확량에 영향을 미친다"는 가설은 양측 검정이 적절하다.
---
## p-값 해석
양측 검정에서의 **p-값**은 귀무가설이 참일 때, 관측된 검정 통계량보다 더 극단적인 값이 양쪽 꼬리에서 나올 확률을 의미한다.
- p-값 < $\alpha$: 귀무가설 기각
- p-값 ≥ $\alpha$: 귀무가설 채택
예를 들어, Z = 2.10이 관측되었을 때, 양측 p-값은 $2 \times P(Z > 2.10) = 2 \times 0.0179 = 0.0358$이다. $\alpha = 0.05$라면 이 값은 유의수준을 하회하므로 귀무가설을 기각한다.
---
## 활용 예시
### 사례: 품질 관리 검사
어떤 공장에서 생산하는 전구의 평균 수명이 1000시간인지 검정하고자 한다.
표본 조사 결과, 평균 980시간, 표준편차 50시간, 표본 크기 100.
- $H_0: \mu = 1000$
- $H_1: \mu \neq 1000$
- 검정 통계량: $Z = \frac{980 - 1000}{50 / \sqrt{100}} = -4.0$
- 기각역: $|Z| > 1.96$ → 기각
결론: 전구의 평균 수명은 1000시간과 유의미하게 다르다.
---
## 참고 자료 및 관련 문서
- [가설 검정](/wiki/가설_검정)
- [단측 검정](/wiki/단측_검정)
- [유의수준](/wiki/유의수준)
- [p-값](/wiki/p-값)
- [신뢰구간](/wiki/신뢰구간)
> **참고 문헌**
> - Moore, D. S., Notz, W., & Fligner, M. (2021). *The Basic Practice of Statistics* (9th ed.). W.H. Freeman.
> - Montgomery, D. C. (2017). *Introduction to Statistical Quality Control* (8th ed.). Wiley.